🎯 Reinforcement Learning

Discussed on DEV

🤖Transformers arxiv.org·

Multi-Head Attention-Based Feature Extractor Integration with Soft Actor-Critic for Porosity Prediction and Process Parameter Optimization in Additive Manufactu...

📊Optimization arxiv.org·

Pareto Q-Learning with Reward Machines

📊Optimization arxiv.org·

Robust $Q$-learning for mean-field control under Wasserstein uncertainty in common noise

📊Optimization arxiv.org·

Reversal Q-Learning

📱Edge AI arxiv.org·

Augmenting Game AI with Deep Reinforcement Learning

✓Formal Verification arxiv.org·

Process-Verified Reinforcement Learning for Theorem Proving via Lean

🎲Deterministic Simulation arxiv.org·

Reinforcement Learning Foundation Models Should Already Be A Thing

📊Optimization arxiv.org·

Diffusion Policy Optimization without Drifting Apart

Covered by DEV Community

📊Optimization arxiv.org·

Proximal Policy Optimization for Amortized Discrete Sampling

💎Cassandra arxiv.org·

Diffusion Offline Reinforcement Learning for Fair and Energy-Efficient UAV-Assisted Wireless Networks

🎨Chroma arxiv.org·

Quantum Annealing Enhanced Reinforcement Learning for Accurate Remaining Useful Lifetime Prediction

🧭Inertial Navigation arxiv.org·

Safe Reinforcement Learning of Autonomous Highway Driving: A Unified Framework for Safety and Efficiency

📊Dynamic Programming arxiv.org·

Learning Fair Pareto-Optimal Policies in Multi-Objective Reinforcement Learning

⏱️Time Series Analysis arxiv.org·

Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations

💬Prompt Engineering arxiv.org·

Video-Based Optimal Transport for Feedback-Efficient Offline Preference-Based Reinforcement Learning

💬Prompt Engineering arxiv.org·

WAM-RL: World-Action Model Reinforcement Learning with Reconstruction Rewards and Online Video SFT

⚓Anchors arxiv.org·

Knowledge Reutilization in Meta-Reinforcement Learning

🔢algo arxiv.org·

Continuous-time Optimal Stopping through Deep Reinforcement Learning

No more posts from hello's subscribed feeds.

Scour all 25,324 feeds Learn more about Feeds

Deep Q-Learning on H\"older Spaces

Building a Self-Optimizing Python Trading Bot with Reinforcement Learning and Binance API

Multi-Head Attention-Based Feature Extractor Integration with Soft Actor-Critic for Porosity Prediction and Process Parameter Optimization in Additive Manufactu...

Pareto Q-Learning with Reward Machines

Robust $Q$-learning for mean-field control under Wasserstein uncertainty in common noise

Reversal Q-Learning

Augmenting Game AI with Deep Reinforcement Learning

Process-Verified Reinforcement Learning for Theorem Proving via Lean

Reinforcement Learning Foundation Models Should Already Be A Thing

Diffusion Policy Optimization without Drifting Apart

Proximal Policy Optimization for Amortized Discrete Sampling

Diffusion Offline Reinforcement Learning for Fair and Energy-Efficient UAV-Assisted Wireless Networks

Quantum Annealing Enhanced Reinforcement Learning for Accurate Remaining Useful Lifetime Prediction

Safe Reinforcement Learning of Autonomous Highway Driving: A Unified Framework for Safety and Efficiency

Learning Fair Pareto-Optimal Policies in Multi-Objective Reinforcement Learning

Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations

Video-Based Optimal Transport for Feedback-Efficient Offline Preference-Based Reinforcement Learning

WAM-RL: World-Action Model Reinforcement Learning with Reconstruction Rewards and Online Video SFT

Knowledge Reutilization in Meta-Reinforcement Learning

Continuous-time Optimal Stopping through Deep Reinforcement Learning